Data Visualization con R e Rmarkdown degli OpenData del MIUR sulle universita Italiane

Open Data Miur Visualization

Un esempio di data Viz, Unsupervised Learning e Interactive Data Presentation.

Introduzione

Questo progetto permette di analizzare e visualizzare i dati relativi alle università italiane (Open Data MIUR).

Il progetto usa R ed è riproducibile facilmente, essendo i dati e tutte le risorse disponibili online.

Pachetti R Richiesti

Per l’esecuzione sono richiesti i seguenti pacchetti R:

  • tidyverse
  • factoextra
  • NbClust
  • ColorBrewer
  • ggplot2

Informazioni sui dati usati

I dati iniziali disponibili sul sito del MIUR riguardano il numero di iscritti divisi per genere, anno e ateneo Italiano per il periodo 2010-2020.

Analisi Preliminare

Dopo il calcolo della media degli iscritti per ogni ateneo viene calcolato il numero K ottimo di cluster da usare nell’analisi KMeans. L’analisi K means permetterà di ottenere una divisione dimensionale degli atenei.

Dall’analisi di Elbow, il numero K ottimo è 4. Di seguito viene riportato il grafico dell’analisi.

Data Visualization

Al termine delle analisi di kmeans, il risultato è la dashboard seguente, che permette di visualizzare i vari cluster e le informazioni di ogni ateneo coinvolto nell'analisi.